#Optimus AI
“友邦驚詫”遭遇中國速度
2025年11月14日,中國機器人公司優必選發佈了一段視訊:數百台Walker S2人形機器人在倉庫中整齊列隊,齊齊轉頭、揮動手臂,隨後魚貫進入集裝箱。這段視訊在社交媒體上引發軒然大波,但爭議的焦點卻出人意料——不是討論技術水平,而是質疑視訊的真實性。美國機器人公司Figure的創始人佈雷特·阿德考克第一時間在社交媒體上發文,聲稱視訊是電腦生成的CGI特效。這場爭論本身,或許比視訊內容更值得玩味:它揭示的不僅是技術認知的鴻溝,更是一場產業權力轉移的前兆。阿德考克的質疑邏輯頗為有趣。他指著視訊中機器人頭部的燈光反射說:“前面的機器人是真的,後面的都是假的。如果你看到頭部反射出天花板燈,那就說明是電腦生成的圖像。”這番話立刻遭到了專業人士的反駁——恰恰相反,真實環境中的金屬表面確實會反射環境光源,這正是物理世界的正常現象。優必選隨後發佈了一段FPV無人機一鏡到底的原聲視訊作為回應,配文寫道:“到底是不是AI生成?一鏡到底原聲原速大揭秘!”然而,正如香港《南華早報》所指出的,阿德考克並非孤例。這種“下意識的不相信”在西方科技界和軍事界已經形成了某種模式。當中國航母福建艦首次展示電磁彈射系統時,美國軍事專家同樣提出了類似的質疑。《南華早報》一針見血地指出:基於過往經驗的假設,似乎模糊了他們對中國當下工業現實的認知。這讓人不禁想起魯迅先生筆下那句著名的諷刺——友邦驚詫。只不過在今天的語境下,這種“驚詫”已經從政治領域延伸到了高科技產業。當中國企業展示出超越預期的技術能力時,部分西方觀察者的第一反應不是承認現實,而是懷疑眼睛。這種認知慣性的背後,是對全球產業格局正在發生深刻變化這一事實的集體迴避。要理解中國人形機器人產業為何能夠實現超預期發展,首先需要理解這個產業的本質特徵。人形機器人是一個高度複雜的系統工程,涉及機械結構、電機驅動、感測器、人工智慧演算法、電池能源等多個技術領域的深度融合。它不是單一技術的突破,而是整個工業體系綜合能力的體現。正因如此,人形機器人的產業化處理程序,與一個國家的製造業底蘊密切相關。深圳南山區的“機器人谷”提供了一個絕佳的觀察窗口。在這裡,數百家機器人研發企業和零部件供應商聚集在方圓數公里的範圍內,形成了一個完整的產業生態系統。當地流傳著一句話,形象地描述了這種產業集聚的密度:“樓上樓下是上下游,產業園就是產業鏈。”這意味著,一家機器人企業可以在步行距離內找到幾乎所有需要的零部件供應商,從精密電機到感測器,從碳纖維外殼到定製晶片。這種空間上的極度接近,大幅縮短了從設計到原型的周期,也讓快速迭代成為可能。深圳某機器人聯合創始人將這種高效歸功於開源協作策略:“通過開源部署和訓練程式碼,我們吸引全球開發者共同建構應用生態。”這種開放式創新模式,與中國完善的供應鏈體系形成了強大的協同效應。成本控制能力是中國人形機器人產業的另一張王牌。2024年10月,北京松延動力推出了一款售價不足一萬元人民幣的人形機器人,目標客戶群是業餘愛好者和程式設計教育機構。值得注意的是,就在六個月前,這款看似平價的機器人剛剛在人形機器人半程馬拉松比賽中獲得亞軍——這說明低價格並不意味著低性能。這種性價比革命的背後,是中國在電機、電池、感測器等核心零部件領域長期積累形成的規模效應和成本優勢。政府層面的支援同樣不可忽視。深圳市政府主動向機器人企業開放了巡檢、消防等公共部門場景,為機器人提供真實的“工作崗位”。龍崗區人工智慧署署長趙冰冰道出了其中的深意:“一些機器人公司在產品發佈後很難找到可行的商業模式。商業機會只有在持續的實際應用中才能逐漸顯現。”這種應用場景先行的策略,為機器人企業提供了寶貴的實戰訓練機會,也加速了技術的迭代完善。與中國人形機器人產業的蓬勃發展形成鮮明對比的,是西方同行們的艱難處境。波士頓動力的命運堪稱這一困境的縮影。這家成立於1992年的公司,以其研發的Atlas人形機器人和Spot四足機器人聞名於世,其機器人展示的奔跑、跳躍、後空翻等動作一度驚豔全球。然而,在商業化道路上,波士頓動力卻步履維艱。2013年,Google母公司Alphabet收購了波士頓動力,希望將其打造成機器人領域的旗艦。然而僅僅四年後的2017年,Google就將波士頓動力出售給了日本軟銀集團,據報導是因為看不到短期盈利的可能。軟銀接手後同樣未能扭轉局面。2020年,軟銀以9.21億美元的價格將波士頓動力轉手賣給了韓國現代汽車集團。三次易主的背後,是西方科技巨頭對機器人產業商業化前景的集體困惑。波士頓動力的困境並非個案。問題的根源在於,西方機器人企業普遍面臨著"技術領先、商業落後"的悖論。它們可以在實驗室裡展示令人驚嘆的技術能力,卻難以找到規模化的商業應用場景;它們可以製造出性能優異的原型機,卻無法以可接受的成本實現量產。用一位行業分析師的話說,波士頓動力的機器人“更像是昂貴的藝術品,而不是可以大規模部署的工業產品”。埃隆·馬斯克的特斯拉Optimus人形機器人項目同樣面臨著嚴峻挑戰。馬斯克在2024年的多次公開場合中展示了Optimus的最新進展,包括其手部設計的改進。據馬斯克透露,新版Optimus的兩隻手及前臂共配備了100個執行器,比之前的版本有顯著增加。這些額外的執行器主要用於實現手指的伸肌功能,取代了之前依賴橡皮筋或扭力彈簧的回位機制,以提高控制精度和穩定性。然而,技術改進並不能解決Optimus面臨的核心問題:大規模量產能力。特斯拉雖然在電動汽車領域展現了強大的製造能力,但人形機器人的零部件複雜度遠超汽車。一台人形機器人需要數十個精密電機、數百個感測器、複雜的關節結構和先進的AI晶片——這些零部件的供應鏈整合是一個巨大的挑戰。更關鍵的是,特斯拉在美國很難找到像中國深圳那樣完整、密集的機器人零部件供應鏈生態。一位海外行業分析師對優必選Walker S2的評價頗具啟發性。他認為這款機器人本身“平庸”,沒有任何單項指標達到業界最佳水平。但他同時指出,Walker S2卻是市場上“最好的通才”之一——它通過專注於倉庫等特定應用場景的最小可行產品,快速切入市場;更重要的是,考慮到中國完善的供應鏈,優必選確實有能力向客戶交付約200台這樣規模的訂單。換言之,中國機器人企業的優勢不在於單項技術的極致突破,而在於系統整合能力和規模化交付能力。這正是理解人形機器人產業格局變化的關鍵。在科技產業的歷史上,“技術最先進”和“商業最成功”往往並不等同。VHS擊敗了技術更優的Betamax,Windows壓倒了更優雅的Mac OS,Android超越了更封閉的iOS。決定產業勝負的,往往不是實驗室裡的技術參數,而是生態系統的完整性、供應鏈的效率、市場響應的速度。在人形機器人這個新興產業中,中國正在以其獨特的產業優勢重塑遊戲規則。優必選首席品牌官譚旻的一番話道出了中國企業的自信:“批評者應該來中國親眼看看人形機器人行業的蓬勃發展,並直接參與到產業鏈中來。”這不是空洞的口號。《南華早報》的報導指出,僅僅一年前,許多機器人還在學習模仿人類的步態;而如今,人形工業機器人已被應用於新能源汽車製造、3C智能生產和智能物流等各個領域。這種從實驗室到工廠的轉化速度,是西方同行們難以企及的。更值得關注的是中國人形機器人產業的生態多樣性。據統計,中國目前約有200家人形機器人初創企業,每家企業都有其獨特的技術重點和市場定位。有的專注於工業場景,有的瞄準服務業,有的主攻教育市場,有的則致力於特種應用。這種百花齊放的格局,與西方市場由少數巨頭主導的局面形成鮮明對比。多元化的競爭格局意味著更快的技術迭代、更豐富的應用場景探索、更健全的人才培養體系。回到文章開頭的那場視訊真假之爭,海外分析師的一個觀察頗為有趣:優必選的視訊可能是故意製作得“像CGI”的。視訊採用了略帶反烏托邦色彩的灰色調,讓人聯想到2005年電影《我,機器人》中的場景;某些鏡頭的景深處理和陰影效果也被刻意設計成容易引髮質疑的樣子。如果這個分析屬實,那麼優必選的行銷團隊堪稱深諳網際網路傳播之道——通過製造爭議來獲得關注,讓全世界都在討論他們的機器人是真是假,而不是討論其他競爭對手的產品。事實上,這種爭議行銷在中國科技企業中已有先例。此前,小鵬汽車的機器人展示就曾引發"是真機器人還是真人扮演"的討論,小鵬通過否認謠言的方式成功獲得了大量關注。優必選在小鵬爭議發生後不到48小時就發佈了回應視訊,時機之巧合令人懷疑他們是否早已準備好這套劇本。無論如何,從傳播效果來看,這場"真假之爭"無疑是成功的——它讓優必選的名字傳遍了全球科技媒體,也讓更多人開始關注中國人形機器人產業的真實水平。站在更宏觀的視角審視,人形機器人產業正處於一個關鍵的轉折點。就像21世紀初的智慧型手機產業一樣,技術已經足夠成熟,應用場景已經足夠明確,剩下的問題是:誰能夠以最低的成本、最快的速度、最大的規模實現量產?在這場競賽中,擁有完整供應鏈、龐大內需市場、充足工程師儲備和政策支援的中國,無疑佔據著有利位置。優必選首席品牌官譚旻的判斷是:機器人行業正處於突破的邊緣。如果這個判斷正確,那麼我們或許正在見證一個新產業霸權的誕生。就像中國在新能源汽車、太陽能、鋰電池等領域的崛起一樣,人形機器人可能成為下一個由中國定義遊戲規則的戰略性產業。而那些還在懷疑視訊真假的人,可能會錯過理解這場產業變革的最佳時機。當然,中國人形機器人產業也面臨著自己的挑戰。在核心演算法、高端感測器、精密減速器等領域,中國企業與國際領先水平仍有差距;在品牌認知和國際市場拓展方面,中國企業還需要更多積累;在技術標準和行業規範的制定上,中國的話語權還有待提升。但這些挑戰,更多是成長的煩惱,而非結構性的障礙。真正值得警惕的,或許是西方同行們的那種認知慣性。當你習慣性地認為對手不可能做到某件事時,你就失去了學習和追趕的動力。波士頓動力三次易主的故事說明,即使擁有最先進的技術,如果缺乏商業化的緊迫感和執行力,也難逃被邊緣化的命運。而那些第一反應是懷疑而非學習的企業家和投資者,可能會發現自己正在重蹈覆轍。魯迅先生在近一個世紀前寫下“友邦驚詫”這四個字時,諷刺的是某些人面對中國變化時的傲慢與偏見。今天,當我們看到一位美國機器人公司CEO在社交媒體上斷言中國企業的視訊是CGI造假時,歷史似乎正在以某種方式重演。不同的是,這一次驚詫的背後,不再是意識形態的對立,而是對產業競爭格局變化的深層焦慮。人形機器人被視為繼智慧型手機、電動汽車之後的下一個兆級市場。在這個賽道上,起跑線的位置可能比衝刺速度更加重要。中國企業憑藉供應鏈優勢、成本控制能力和應用場景積累,已經佔據了有利的起跑位置。而當部分西方觀察者還在討論視訊真假的時候,中國的機器人工廠裡,新一批Walker S2可能正在魚貫走下生產線,準備裝箱發往全球各地的客戶手中。這就是真實正在發生的未來。它不需要CGI來美化,也不會因為質疑而停止前進。那些拒絕相信的人,終將被現實說服——只是到那時,追趕的窗口可能已經關閉。在人形機器人這個註定改變人類生產生活方式的產業中,中國正在書寫自己的篇章。而“友邦驚詫”,或許只是這個故事中一個有趣的註腳。 (心智觀察所)
特斯拉的未來十年:從汽車製造商邁向 AI 驅動的平台
特斯拉的“現實世界 AI 平台”路線:機器人計程車(Robotaxi)是“軟體毛利 + 高利用率”的價格革命,但短期仍是帶安全員的小規模受控試點,核心變數取決於演算法安全性與監管落地。儲能業務:2024 年全年部署 31.4GWh,2025 年二季度單季 9.6GWh;過去四季度滾動 37.9GWh。產能側,三座 Megapack 工廠合計約 83GWh/年,內華達 10GWh/年 LFP 電芯廠接近投產。人形機器人(Optimus)商業化尚處早期:量產體系、靈巧操作與安全認證仍是硬骨頭。基礎設施路線調整:Dojo 項目停止、轉向 AI6 晶片與“板級多 SoC”(SoC,System on Chip,意為把處理器、記憶體、介面整合在一塊晶片上的方案)思路,折射出公司在自研算力 vs. 外部代工之間的務實取捨。一、Robotaxi:用“利用率”和“軟體毛利”重寫每英里成本商業邏輯傳統出行的單位里程成本被三件事主導:車輛折舊/資本成本、能源與維運、駕駛員工資。私家車每天 90% 以上時間閒置,資本開支被極低利用率“攤薄”;而 Robotaxi 若在“地理圍欄 + 時段限制”下穩定營運到 40–60% 日利用率,固定成本可顯著攤薄,疊加軟體邊際成本接近零,理論上能把“每英里可變成本”壓到僅剩電耗與維護。這是它有望對傳統網約車形成單位成本斷崖碾壓的根基。現實進度2025 年 6 月 22 日,特斯拉在奧斯汀上線受邀小範圍 Robotaxi 試點,6:00–24:00、地理圍欄、帶安全員;隨後在部分友好轄區獲批開展帶安全員測試。路徑是“先有安全員的准無人化 → 積累資料與安全背書 → 再謀求無人化許可”。與完全無人駕駛的商業化仍有距離。監管與輿情約束(核心風險)美國監管部門在 2024–2025 年對特斯拉自動駕駛相關問題的調查持續推進,覆蓋數量可觀的車輛與功能模組;部分城市對“無安全員上線”保持高壓審查。監管不確定性與事故透明度將直接決定 Robotaxi 的擴張速度。結論技術:在相同路段和氣象條件下,行駛百萬英里事故率能否持續優於人類駕駛合規:獲得無安全員許可的城市數量與活躍車輛規模;經濟性:單位里程 TCO (TCO,總擁有成本)是否隨利用率提升出現拐點(對比本地網約車司機含佣金的成本曲線)。受監管與安全門檻影響,“百萬車規模”的時間表應更審慎;但一旦在數個核心城市實現無安全員常態化,商業模型將快速自證。二、能源儲能:從“配角”走向“利潤支點”的產業化曲線確定性資料部署端:2024 年全年 31.4GWh;2025 年 Q2 單季 9.6GWh;過去四季度滾動 37.9GWh,2025 年上半年合計約 20GWh。訂單能見度與規模效應正在兌現。產能端:內華達與上海共計三座 Megapack 工廠,年產能合計約 83GWh,並在爬坡;配套的內華達 LFP 電芯工廠初期 10GWh/年,接近投產,主要供 Powerwall/Megapack。製造與供應鏈(為什麼能做大)垂直整合與標準化:自制 LFP 電芯 + 標準化電力電子(逆變/PCS/EMS)降低 BoS 成本、縮短交付周期;同平台 SKU 支撐“工廠式批次出貨”。學習曲線:電池系統遵循“賴特定律”,累計產量每翻倍帶來單位成本持續下降;滾動四季度 37.9GWh 的出貨為下一輪降本與議價提供樣本。產能利用率:在約 83GWh 年產能背景下,滾動出貨 37.9GWh 對應約 45% 利用率,仍有顯著上行空間;當工廠爬坡穩定,毛利具備繼續修復的物理基礎。電網側商業模式(多重收入)電池除了做“能量套利(低價存電,高價賣電)”,還能參與“容量市場”(提供備用電力)、“輔助服務”(調頻、備用電源)以及“需量管理”(幫助企業削峰填谷)疊加“虛擬電廠(VPP)/聚合調度”軟體訂閱,形成“製造業 + SaaS”的復合收入結構。2025 年中期的披露顯示能源業務毛利創新高,側證“硬體 + 軟體”的組合正在拉動利潤。變數與約束資本開支/原料:鋰、磷酸鐵、銅等大宗對成本的彈性仍在;政策與並網:稅抵與州級激勵有幫助,但並網規則、容量市場設計變化會影響收益兌現節奏;產品進化:2025 年 9 月發佈 Megapack 3/Megablock,訴求更高能量密度與更快部署,以系統化交付進一步壓縮 EPC 周期。結論與 Robotaxi 相比,儲能是當下最“可驗證”的曲線:訂單—產能—出貨—毛利改善鏈條已跑通,且電芯自產與系統標準化帶來持續降本與交付提速的飛輪。投資觀察可聚焦:季度部署量、產能利用率、單位系統毛利三條線是否繼續抬升。三、Optimus:面向“勞動力即服務”的長周期押注價值主張製造與倉儲環節存在大量重複、對抗疲勞的任務(物料搬運、打包、簡單工站操作)。若人形機器人能在無需大改造的人類工廠環境中安全協作,其商業化就能借助訂閱/租賃模式,接近“按小時付費的人力外包”,並以軟體更新的方式規模化分發技能。進展與分歧目標口徑為 2025 年小批次(內部)、2026 年對外;機器人載荷與體尺規格的大致定位在“可搬運約 20kg”的能力帶。與行業對手相比,特斯拉需要拿出穩定的靈巧操作與安全認證資料,並把它放到可複製的量產工藝上。製造視角的難點良率與一致性:驅動器/減速器、力/扭矩感測、手部自由度等零部件對裝配精度與一致性要求極高;可靠性:工業客戶會盯“平均無故障時間(MTBF)”,這決定 OEE(裝置綜合效率) 與訂閱定價;合規:與人協作(cobot)類應用需要功能安全標準與風險評估背書。這意味著即便技術可演示,也必須在供應鏈/工藝/認證三條線上同步突破。時間表應偏保守,先從特斯拉自家工廠的限定場景做深做透,再逐步外放四、算力與晶片:從 Dojo 退場到 AI6 的務實轉向2025 年中後期,特斯拉終止 Dojo、將資源傾斜至 AI6 晶片,思路是用大量 AI5/AI6 SoC 的“板級並聯”來兼顧推理與訓練,晶片由台積電/三星代工。邏輯是:在成本、進度與可製造性之間權衡,與其自建一條全新的訓練體系,不如把車載/機器人推理晶片的規模效益延伸到訓練叢集,縮短產品化路徑。對投資者而言,這意味著更多外部代工與更快量產節拍,但也意味著對先進工藝與封裝的外部依賴上升五、把“三根曲線”擰成一股繩:投資者應如何跟蹤里程碑統一願景是“現實世界 AI 平台”:交通:軟體定義的 Robotaxi,把“人力成本”從單位里程裡移除;能源:電化 + 儲能把能源變成“可編排資產”,由軟體調度變現;機器人:把“體力勞動”軟體化與訂閱化,形成“勞動力即服務”。中期跟蹤指標:Robotaxi:獲得無安全員許可的城市數、有效服務里程、事故率曲線;儲能:季度部署(GWh)、Megapack 工廠產能利用率、能源業務單季毛利與 VPP 軟體滲透;Optimus:內部累計工時、穩定完成的標準化工位任務數量、外部付費 可行性驗證進展;晶片/算力:AI6 測試流片與量產節奏、與外部代工的產能鎖定與封裝良率。特斯拉三條主線都直指“把資本性資產和體力勞動變成可被軟體調度與收費的服務”。儲能業務已進入“量產—交付—盈利修復”的可驗證周期;Robotaxi 與 Optimus 則取決於安全、監管與製造可複製性的共振突破。對於 7.5–10 年的“躍遷式願景”,更穩健的做法是用季度與年度的中期里程碑持續校準:當看到無安全員的規模化落地、儲能出貨與毛利的持續抬升、機器人在限定場景的可複製產線化,那將是這台“現實世界 AI 平台”真正開始釋放經營槓桿的訊號。 (Tech豆)
小札把馬斯克機器人一號挖走了
馬斯克在忙著裁人,小札這邊繼續忙著挖人。這不?Optimus AI團隊負責人Ashish Kumar決定離開特斯拉,加入Meta擔任研究科學家。至於離職感言,他說:帶領Optimus AI團隊的經歷非常精彩且難忘。我們全力推進可擴展方法——以強化學習取代傳統技術堆疊,並透過視頻學習來提升機器人的靈巧度。他也進一步強調,人工智慧才是解鎖人形機器人的最關鍵因素。與此同時,小札砸錢挖人的形像已經深入人心,使得網友不禁銳評,有10億美元嗎?Optimus團隊負責人接連出走那這位Optimus AI團隊負責人到底是何大神?Ashish Kumar,UC伯克利博士,導師是被李飛飛尊稱為「學術祖父」的Jitendra Malik教授,因在CV領域的研究而聞名。2015年,Ashish本科畢業於印度理工學院焦特布林分校,之後到微軟位於印度的實驗室做了兩年研究員,研究方向是資源高效的機器學習演算法。2017年,Ashish從職場重返校園,開始到UC伯克利攻讀博士,2023年7月他以ML科學家的身份加入特斯拉,一年多之後便成為柯博文的AI負責人。除此之外,在柯博文出走的不只這一位,今年6月,Optimus項目負責人Milan Kovac宣佈離職。Milan Kovac在2008年本科電氣工程專業畢業後,曾從事遊戲開發者。他的第一份工作是在比利時動作辨識公司SoftKinetic,主要負責不同平台的移植工作,後來為英特爾開發視覺元件。4年後該公司被索尼收購,Kovac輾轉了幾家公司,於2016年4月正式加入特斯拉,擔任Autopilot核心團隊工程師,負責Autopilot底層處理程序管理工作,後歷任自動駕駛軟件工程經理、高級工程經理以及Autopilot軟件工程主管。2022年,Kovac升任Optimus項目負責人,在他的領導下,特斯拉的人形機器人從概念發展為一款功能齊全的第二代雙足機器人,並能在特斯拉工廠中自主工作。可以說,作為特斯拉9年老將,Kovac從自動駕駛起步,然後作為創始成員從零開始打造柯博文。對此,馬斯克特意在他推文底下感謝了他過去十年傑出貢獻。(這次負責人離職咋沒有感謝呢,不會是……)關於機器人,前一陣特斯拉發布《宏偉藍圖4》後,馬斯克曾透露:特斯拉未來80%的價值將來自Optimus。但這負責人頻頻出走,馬斯克的機器人大業還能順利展開嗎?One More Thing馬斯克外有小札虎視眈眈,內有親密顧問與高階主管爆發衝突。據《華爾街日報》爆料,由於對公司管理和財務狀況感到擔憂,xAI的幾位高管在與馬斯克的兩位最親密的顧問發生衝突後紛紛離職。△Jared Birchall和John Herin這兩位顧問分別為Jared Birchall和John Herin,主要負責監督xAI的日常運營,而馬斯克作為執行長負責做出最終決策。知情人士稱,xAI部分高層在內部曾對Birchall和Hering試圖代表馬斯克名義管理公司的方式表示反對,並認為他們缺乏正式的指揮鏈。所以說,馬斯克的AI之路,下一步是不是得先調整組織架構了。參考連結:[1]https://x.com/ashishkr9311/status/1968827611133427772?s=46[2]https://x.com/sawyermerritt/status/1968831226585739667?s=46[3]https://www.wsj.com/tech/ai/elon-musk-xai-executives-advisers-clash-eac3913b?utm_source=chatgpt.com (量子位元)
特斯拉Optimus AI靈魂人物跳槽Meta
Ashish Kumar,作為特斯拉Optimus人形機器人項目的人工智慧負責人,於2025年9月正式離開公司,轉而加入Meta擔任研究科學家一職。Kumar在特斯拉任職超過兩年時間,自2023年7月起領導Optimus的AI團隊,專注於機器人操縱、舞蹈、自然行走和魯棒性等核心技術開發。他的離職正值特斯拉大力推進Optimus項目之際,這款人形機器人被視為公司未來增長的關鍵支柱,旨在應用於工廠生產、家庭服務等領域。Optimus項目是特斯拉CEO埃隆·馬斯克(Elon Musk)長期推動的願景之一,自2021年首次亮相以來,已從概念原型演變為具備自主學習能力的機器人系統。Kumar的背景為其在該項目中的角色增添了專業深度:他持有加州大學伯克利分校的博士學位,曾在機器人學習和AI領域發表多篇論文,並在加入特斯拉前積累了豐富的學術和行業經驗。在Kumar的領導下,Optimus實現了多項突破,例如通過觀看人類視訊自主執行家務任務,並整合統一的神經網路處理文字指令和動作生成。這些進展不僅提升了機器人的實用性,也為特斯拉的自動駕駛和AI生態提供了技術協同。Kumar選擇加盟Meta,可能與後者在生成式AI和元宇宙領域的快速發展有關。Meta近年來加大了對AI研究的投入,包括Llama模型系列和現實實驗室的項目,這或許為Kumar提供了更廣闊的平台來探索機器人與虛擬互動的融合。然而,這一跳槽也引發了外界對特斯拉Optimus團隊穩定性的質疑。特斯拉的機器人項目已非首次面臨人才流失,今年6月,另一位關鍵人物Milan Kovac也離開了公司,這可能反映出內部競爭壓力或戰略調整。分析人士猜測,Kumar的離去或將延緩Optimus的迭代速度,尤其在AI演算法最佳化方面,但特斯拉強大的工程師團隊和馬斯克的領導力或許能通過內部晉陞或外部招聘來彌補空缺。當然,這也可能只是科技行業人才流動的常態,而非項目危機的訊號。特斯拉的Optimus不僅僅是機器人產品,更是馬斯克“通用人工智慧”願景的一部分,目標是實現大規模部署以改變勞動力市場。但面對Meta、OpenAI等競爭對手的吸引力,特斯拉需加強內部激勵機制,以維持創新勢頭。 (MaXTe)
年費超 2 萬!馬斯克剛剛發佈最貴 AI ,Grok 4 號稱所有領域碾壓博士
馬斯克憋了快半年,終於把 Grok 4 端上了檯面。這一次,他的口氣依舊不小。早在發佈會前就放出狠話,聲稱 Grok 4 要「重寫人類知識庫」。等到了發佈會上,馬斯克再次強調 Grok 4 是目前世界上最聰明的 AI。可以,熟悉的味道,熟悉的配方。當然,馬斯克誇自家產品這事兒,大家早就見怪不怪,但正如網友所調侃的那樣,你可以嘲笑 xAI 員工在辦公室帳篷裡睡覺或者周末工作到凌晨 4:20,但也得承認,他們的確是當下發展速度最快的 AI 實驗室之一。至於 Grok 4 能不能配得上「最聰明 AI」的稱號,還得看後續的實際體驗。不過,有一點是跑不了的——它已經成了市面上最貴的 AI,年訂閱價格最高可達到 3000 美元,定價策略可謂是相當不講武德。世界上最聰明的 AI?世界上最貴的 AI!Grok 的訓練路徑分為兩個核心階段:預訓練與強化學習。從 Grok 2 到 Grok 3,主要依賴預訓練方式;而從 Grok 3 升級到 Grok 4,則大幅引入了以推理能力為核心的強化學習訓練。馬斯克說得輕描淡寫,但訓練的動靜卻不小。相比 Grok 2,Grok 4 的訓練計算量提升了整整兩個數量級,相當於增長了 100 倍——而且還在持續擴張。馬斯克表示,Grok 4 已在所有主要學科上超越博士水平。雖然它目前尚不具備發明新理論或提出原創技術的能力,但在他看來,這只是時間問題。他甚至預言,今年底 Grok 可能就能發明新技術,明年幾乎可以確定將具備發現新物理規律的能力。讓 AI 接入現實世界,才是真正的關鍵。馬斯克表示,Grok 與人形機器人 Optimus 的結合,將形成一個閉環推理系統——提出假設、驗證假設、探索現實。這將開啟一個智能大爆炸的時代,是人類歷史上最令人激動的節點。在產品形態上,Grok 4 是單智能體模型,而 Grok 4 Heavy 則是多智能體版本。前者比較好理解,而後者則支援多個智能體平行思考,在推理過程中橫向比對、縱向協同,呼叫更大規模的計算資源以完成更複雜、更精密的任務。在現場演示中,Grok 4 Heavy 展示了多個場景能力。比方說,讓 Grok 4 Heavy 去預測今年 MLB 世界大賽(World Series)的冠軍機率,它通過資訊檢索、資料建模、機率計算,評估洛杉磯道奇隊的奪冠機率為 21.6%,並在 4.5 分鐘內完整輸出預測過程。再比如,讓它找出 xAI 團隊裡頭像最奇怪的那一個。依託 X 平台的資料庫,模型自動抓取並分析頭像風格,最後鎖定了聯合創始人 Greg Yang。有趣的是,雖然模型精準理解了「奇怪」這一概念,並能在同類中做出相對判斷,但在一滑而過的演示中,我似乎看到了 Anthropic 員工 Jan Leike 的頭像,看來精準率也有待提高。除了推理和搜尋,Grok 還能生成內容時間軸。比如,根據 X 平台上的公開發帖,它能梳理出多個 AI 模型的基準測試成績、廠商更新節奏以及社區反應。使用者可以一目瞭然地看到 OpenAI 的分數表現、Gemini 的更新迭代等。換句話說,Grok 不是只會考試的書呆子,而是真正具備跨場景理解與執行能力的 AI。目前,Grok 最大的短板依然集中在多模態理解能力,尤其是在圖像理解和生成方面,能力仍有待加強。好消息是,下一階段的基礎模型訓練已經在路上,預計幾周內完成。演示過程中,在測試「兩個黑洞相撞過程」的可視化任務時,Grok 採用了簡化的計算方式——使用後牛頓近似(Post-Newtonian approximation)替代完整的廣義相對論框架。儘管存在簡化,模型依然精準地呈現了黑洞併合的關鍵物理階段,包括「螺旋接近」、「合併」與「振鈴階段」,並能清晰說明改採用的近似方法。此外,它還呼叫了相關教材、公開搜尋結果及實際物理常數進行推理支援,整體邏輯鏈條嚴謹、解釋清晰。就紙面參數而言,Grok 4 也交出了亮眼答卷。Humanity’s Last Exam(人類最後的考試,簡稱:HLE,)覆蓋了數學、物理、電腦、醫學、人文社科等超過 100 個學科,共 2500 道閉卷題,測試難度極高,能夠真實反映模型在通用知識和複雜推理上的綜合表現。根據 xAI 資料,Grok 4 在不使用任何工具的情況下,得分為 25.4%,超過了 Google Gemini 2.5 Pro 的 21.6% 和 OpenAI o3(高配版)的 21%。而在使用工具的情況下,Grok 4 Heavy 的得分達到 44.4%,遠高於使用工具後 Gemini 2.5 Pro 的 26.9%。非營利組織 Arc Prize 則指出,Grok 在其 ARC-AGI-2 測試中創下新紀錄。這是一項視覺推理類基準測試,AI 需識別圖像中的模式。Grok 的得分為 16.2%,幾乎是當前排名第二的 Claude Opus 4 的兩倍。面對一些常規的基準測試中,Grok 4 Heavy 的分數幾乎也快「刷滿」分數。在博士級難度的問題集 GBQA 中,儘管整體難度略低於 HLE,Grok 4 Heavy 依然取得了滿分成績,展現出極強的推理與理解能力。不僅如此,在多項程式設計相關測試中,Grok 4 Heavy 的表現同樣搶眼。無論是 Live Coding、HMMT(麻省理工數學競賽)還是 USAMO(美國數學奧林匹克),它都遠超當前排名第二的模型,技術優勢相當明顯。另外,知名分析機構 Artificial Analysis 通過對多款主流大模型在 7 個推理相關基準(MMLU-Pro、GPQA Diamond、Humanity’s Last Exam、LiveCodeBench、SciCode、AIME、MATH-500)上的綜合表現進行評估。資料顯示,Grok 4 位列第一,得分為 73,是目前推理能力綜合得分最高的模型。緊隨其後的則是 o3-pro(估算值)71 分。馬斯克也強調:未來 Grok 將幾乎在所有考試中答對每一個問題。而當它答不出某個問題時,它會指出題目的錯誤之處,或者指出問題含糊不清的地方,並給出不同情境下可能的答案。到那時,傳統考試將失去意義。AI 唯一的檢驗標準將是現實世界:它是否能發明有用的技術,是否能推動科學的突破。所以 HLE 這類測試題庫必須盡快更新,因為以當前的 AI 進展速度,它們很快就會過時。截至發稿前,Grok 4 和 Grok 4 Heavy 目前均已陸續上線。目前,Grok 4 和 Grok 4 Heavy 已全面上線。使用者可以通過訂閱訪問,不過,訂閱價格就有點「不講武德」,最高可去到 3000 美元/年檔位,成了不少使用者吐槽的焦點。這麼一比,OpenAI 、Anthropic 以及 Perplexity 的 200 刀/月套餐都顯得十分良心。值得一提的是,發佈後不久就有網友表示,Grok-4 與 Grok-4-Heavy 模型已經被成功「越獄」。越獄後的能力極其危險,可繞過安全護欄,輸出敏感或非法資訊,比如化學武器合成步驟、《星球大戰1》的完整劇本(涉嫌版權)、甚至勒索病毒(惡意程式碼)等。不只會說話,Grok Voice 還有了「靈魂」除了更強的推理能力,更聰明,Grok 4 這次也在「更像人」這件事上,邁出了一大步。跟我們熟悉的語音助手不同,xAI 全新語音助手「Eve」不只是能答話,它能表達情緒、有語調變化,甚至還能現場「唱歌」。在直播現場的演示上,它用一口優雅的英音,唱了一首即興創作的「Diet Coke 詠歎調」,「O Diet Coke, thou elixir divine…」聽起來真的不像是 AI,像是倫敦劇場裡的舞台演員在表演。這次語音模型一共上線了五種聲音,包括直播開場的「電影一般的預告男聲」Sal,以及支援低延遲、自然停頓、情緒起伏等能力的 Eve。現場還安排了一段和 ChatGPT Voice 的對比演示,兩者輪流複述數字。ChatGPT 時不時「搶答」,有點像沒聽清就硬接話的同學。而 Grok 的表現更流暢、更貼近人類說話習慣,而且不會打斷使用者說話。發佈會上提到,自語音模型上線以來,Grok Voice 的端到端延遲縮短了兩倍,活躍使用者也增長了 10 倍。Grok Voice 正在迅速發展。馬斯克:讓 Grok 去開一百萬個自動售貨機賺錢幾個 Grok 4 API 的應用場景讓我印象非常深刻。比如,在一項自動售貨機商業模擬 Vending-Bench中,Grok 被要求自主完成:供應商協商、庫存管理、定價策略,連續完成並長期保持盈利。註:Vending-Bench 是一個專門設計用於測試基於 LLM 的代理,在管理一個簡單但長期運行的業務場景中的能力:營運一台自動售貨機。測試結果顯示,Grok 4 不僅登頂排行榜,而且它所獲得的淨資產是其他模型的兩倍。連馬斯克都開始調侃說:「以後買顯示卡的錢,可以讓 Grok 去部署營運一百萬個自動售賣機賺回來」。在科研領域,Grok 4 已被用於 CRISPR 基因研究和胸片 X 光分析。它能在幾秒鐘內讀完幾百萬條實驗記錄和日誌,自動篩出最有可能成功的假設。此外,像是金融領域、遊戲開發等項目,都可以通過 xAI API 來使用 Grok 4 來實現。發佈會上特別提到了一個遊戲設計師,他在 xAI 發佈了 Grok 4 預覽 API 後,就立刻參與測試。然後,他花了短短 4 小時就做出了一個第一人稱射擊遊戲。Grok 4 不是終點。發佈會最後預告了接下來的路線圖,每一項都非常值得期待。程式碼模型:這次竟然沒有發佈 Grok Code,不過 xAI 提到正在訓練了,一個「又快又聰明」的程式碼模型將會在幾周內上線。多模態能力:Grok 4 在圖像理解上表現依舊是有限,團隊也說正在以更大規模訓練下一個版本,預計會在圖像、視訊和音訊理解上迎來質變,到時 Grok 將能「像人類一樣看世界」。視訊生成:xAI 說將使用大規模的算力資源,進行視訊生成模型的訓練。他們的最終目標是做到圖生視訊,生成可互動的「無盡視訊流」,讓使用者能邊看邊參與劇情走向。可能有不少朋友已經發現,這次發佈會還有兩個熟悉的華人面孔。他們正是 xAI 的聯合創始人——吉米·巴(Jimmy Ba)和吳宇懷(Yuhuai Wu)。其中,吳宇懷(Yuhuai Wu)本科以滿績點畢業於加拿大紐布倫斯威克大學,並在 2021 年獲得多倫多大學機器學習博士學位,期間曾師從「深度學習之父」傑弗裡·辛頓。博士階段,他還曾在 Google DeepMind 和 OpenAI 實習,畢業後在 Google 任職,並在史丹佛大學從事博士後研究。吳宇懷的研究重點是打造具備強推理能力的人工智慧系統,先後主導或參與了自訓練推理模型 STAR、語言模型 Minerva 以及定理證明器 Alpha Geometry 等項目,並在《Nature》等頂刊上發表論文,推動 AI 在數學推理領域實現突破。吳宇懷(左二)和吉米·巴(左三)坐在他身旁的吉米·巴(Jimmy Ba)則是多倫多大學電腦科學系的助理教授,也是吳宇懷博士時期的導師之一。他同樣出身於辛頓門下,是深度學習訓練最佳化領域的關鍵人物。最為人熟知的,是他與合作者共同提出了 Adam Optimizer(自適應矩估計最佳化器)——如今幾乎成為深度神經網路訓練的默認演算法。可以說,他的博士論文為現代 AI 訓練機制奠定了堅實理論基礎。不得不說,Gork 4 的到來適逢其時。前代 Grok 3 的熱度來得猛,退得也快。根據知名市場分析機構 SimilarWeb 發佈的截至 5 月 9 日的《2025年全球生成式AI行業趨勢報告》,Grok 從三月流量暴漲超 100 萬倍,到五月增幅跌回 5200%。相比前代倉促上線、草草交卷的節奏,這次的 Grok 4 明顯放慢了腳步,在產品打磨上也更下功夫。歸根結底,馬斯克的光環可以幫 Grok 帶來第一波流量,但能不能留下使用者,還得靠模型本身的硬實力。只不過,我沒記錯的話,馬斯克當初在 Grok 3 發佈時,還信誓旦旦說要把 Grok 2 開源。眼看五個月過去了,這事兒卻毫無動靜,這次發佈會上也沒再提半句。老馬啊,可不能寬於律己,嚴以待人呀。 (APPSO)